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摘 要 : 针对 雷达 辐射 源 信号 识别 课题 中 复杂 的 参数 配置 问题 ， 从 机 器 学 习 参 数 优 化 的 研究 入 手 ， 发 现 了 一 种 基于 树 
结构 的 机 器 学 习 流 程 优化 方法 ， 该 方法 利用 遗传 编程 生成 基于 树 结构 的 机 器 学 习 流 程 ， 并 对 其 结构 和 参数 进行 进化 ， 
得 到 表现 最 佳 的 带 参 数 的 机 器 学 习 流 程 。 该 流程 可 以 包括 特征 处 理 和 建 模 的 任意 组 合 ， 实 现 对 原始 数据 集 的 学 习 和 识 
别 。 并 与 人 工 参数 配制 的 一 对 一 支持 向 量 机 在 两 种 不 同 维度 的 雷达 信号 特征 集 上 进行 对 比 识别 ， 相 比 之 下 ， 该 方法 无 
须 繁 琐 的 参数 配置 ， 最 高 准确 率 提高 超过 6%， 证明 该 方法 得 到 的 基于 树 结构 的 机 器 学 习 流 程 有 着 明显 的 优势 。 
关键 词 : 自动 机 器 学 习 ; 超 参 数 优化 ; 遗传 编程 ;雷达 辐射 源 信 号 ; 支持 向 量 机 
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Abstract: In order to solve the problem of complex parameter configuration in radar emitter signal recognition, this paper found 
a tree-based machine learning pipeline optimization method, based on the study of machine learning parameter optimization. 


This method uses GP to generate the tree-based machine learning pipeline, and gets the best machine learning pipeline with the 


best parameters through the evolution of the pipeline and parameters. The pipeline could include any combination of feature 


processing and modeling to achieve the learning and recognition of the original data set. This paper compared recognition effect 


of this method and the SVM method in the radar emitter signal feature sets of two different dimensions. In contrast, this method 
does not require cumbersome parameter configuration, and the highest accuracy is improved by more than 6%. It is proved that 
the tree-based machine learning pipeline obtained by this method has obvious advantages. 
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程 是 先 对 原始 数据 进行 数据 清洗 ， 经 过 特征 提取 、 特 征 构 建 、 
特征 选择 、 最 后 交 由 经 过 参数 优化 的 分 类 模型 进行 分 类 。 在 这 
于 以 相 控 阵 雷达 为 代表 的 新 体制 雷达 的 投入 使 用 与 战场 ” 套 流程 中 ， 实 验 者 需要 以 某 种 方式 转换 数据 ， 使 其 更 适合 于 建 
中 辐射 源 数量 的 急剧 增加 ， 在 现代 战场 电磁 环境 下 ， 信 号 越 来 。 模 , 例如 通过 对 特征 进行 归 一 化 ( 即 特征 变换 )， 去除 对 于 建 模 
越 密集 ， 信 号 样式 越 来 越 复 杂 ， 这 对 雷达 辐射 源 信号 的 识别 带 不 太 有 用 的 特征 ( 即 特征 选择 ), 或 从 现 有 数据 创建 新 特征 ( 即 
来 越 来 越 大 的 挑战 申 。 现 阶段 的 识别 研究 基本 围绕 特征 提取 、 特征 构造 )。 然后 实验 者 必须 选择 合适 的 机 器 学 习 模 型 ( 即 模 型 


Cu 


特征 选择 和 分 类 器 分 类 这 三 个 部 分 展开 ， 识 别 的 方法 主要 以 机 ”选择 )， 并 选择 使 分 类 结果 最 准确 的 模型 参数 〈 即 参数 优化 )， 

器 学 习 为 主 口 。 以 保证 最 后 的 分 类 准确 度 。 有 经 验 的 专家 尚 难以 较为 轻松 地 设 
前 ， 在 雷达 辐射 源 信 号 识别 的 研究 中 ， 使 用 的 信号 特征 好 这 些 步 又 ， 更 不 论 在 信号 日 益 复杂 的 背景 下 其 他 人 员 配 置 

有 直接 测量 得 到 的 到 达 时 间 (TOA)、 载 频 (RF)、 脉 宽 PW)、 脉 幅 ”步骤 和 参数 的 能 力 了 3。 

(PA)、 到 达 方 向 (DOA) 等 , 也 包括 越 来 越 受到 重视 的 脉 内 特征 只 。 在 过 去 的 20 年 中 已 经 看 到 了 智能 系统 突飞猛进 的 发 展 ， 

主要 采用 的 机 器 学 习 方法 有 支持 向 量 机 (SVMJ)、 人 工 神经 网 络 。 它们 在 如 太空 天 线 的 设计 、 大 型 软件 项 目 漏洞 的 发 现 和 修补 ， 

(ANN)、 随 机 森林 (RE) 等 中。 甚至 与 人 围棋 对 弈 等 各 种 各 样 的 任务 中 ， 都 能 够 有 明显 超越 人 


由 于 基本 采用 机 器 学 习 的 方法 ， 雷 达 辐 射 源 信号 的 识别 问 ”类 的 表现 。 可 见 这 些 智 能 系统 有 着 巨大 的 创造 力 ， 那 么 ， 智 能 
明 于 机 器 学 习 问题 的 一 部 分 ， 当 前 典型 的 机 器 学 习 流 ”系统 可 以 自动 设计 机 器 学 习 流 程 吗 ? 
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答案 是 肯定 的 ， 当 前 的 研究 中 ， 关 于 机 器 学 习 流 程 优化 的 1.1.3 特征 选择 
方法 有 贝 叶 斯 优化 、 网 格 搜索 、 双 层 优 化 等 。 一 直 以 来 ， 自 动 使 用 的 特征 选择 方法 有 RFE、 Select KBest、 Select Percentile 
机 器 学 习 (auto MID) 的 研究 主要 侧重 于 优化 模型 参数 ， 以 发 现 能 和 Select Percentile 。 这 四 种 方法 分 别 采 用 递归 特征 消除 策略 、 
实现 分 类 准确 度 最 大 化 的 模型 参数 ， 最 近 的 研究 表明 ， 随 机 搜 。 选择 最 优 k 个 特征 的 策略 、 选 择 最 优 前 n% 特 征 的 策略 和 移 除 
索 比 穷 举 搜索 更 能 有 效 地 发 现 理想 的 模型 参数 内。 尤其 是 利用 不 符合 最 小 方差 浆 值 的 特征 的 策略 。 
贝 叶 斯 优化 得 到 的 模型 参数 ， 一 直 有 着 理想 的 甚至 优 于 手动 调 1.1.4 模型 选择 
参 的 分 类 效果 钻 。 由 于 识别 对 象 基本 是 有 标签 的 数据 样本 ， 因 而 TPOT 使 用 

本 文 使 用 基于 树 结构 的 流程 优化 工具 (TPOT), 该 工具 使 用 有 监督 的 学 习 模型 ,包括 基于 树 结构 的 决策 树 分 类 器 (decision 
遗传 编程 (Genetic Programming，GP) 的 一 个 模型 自动 地 设计 和 tree)、 随 机 森林 分 类 器 (random forest) 和 gradient boosting， 以 及 
优化 机 器 学 习 流 程 站 。 本 文 结合 雷达 辐射 源 信号 识别 问题 的 特 支持 向 量 机 (SVM)、 逻 辑 回归 (logistic regression) 和 K 近邻 法 
点 与 机 器 学 习 流程 优化 的 优点 ， 将 该 工具 引入 雷达 辐射 源 信号 。 (KNN) 等 。 
识别 的 研究 中 ， 并 通过 遗传 编程 的 相应 设置 在 保证 分 类 精度 最 以 上 操作 算 子 均 采用 scikit-learn 机 器 学 习 库 实现 ， 这 是 一 
大 化 的 同时 减少 流程 的 复杂 个 通用 的 Python 机 器 学 习 库 9。 

ed 1.2 流程 的 构建 

1 ”基于 树 结构 的 自动 机 器 学 习 流程 上 面 提 到 的 四 类 操作 算 子 就 是 遗传 编程 中 的 树 结构 的 节点 ， 

常规 的 机 器 学 习 ， 需 要 人 根据 大 量 实验 总 结 的 经 验 去 构建 除 此 之 外 还 有 一 种 算 子 特征 合并 ， 使 用 该 操作 算 子 用 来 将 
寺 征 、 选 择 特征 ， 选 择 合 适 的 分 类 器 并 设置 合适 的 分 类 器 参数 多 输入 合并 为 单 输入 ， 具 体 的 介绍 请 看 下 面 。 
等 一 系列 流程 ， 对 于 不 同 的 识别 对 象 ， 各 流程 设置 不 尽 相 同 ， 所 有 由 遗传 编程 生成 的 流程 ， 都 开始 于 原始 数据 集 及 其 副 
这 对 人 工 调 优 带 来 了 巨大 的 挑战 。 本 文 使 用 根据 遗传 编程 设计 本 ， 也 就 是 树 的 叶子 ， 在 叶子 之 后 即 是 四 类 操作 算 子 一 一 特征 
的 基于 树 结构 的 自动 机 器 学 习 流 程 进行 流程 优化 ， 图 1 所 展示 预 处 理 、 分 解 、 特 征 选 择 和 分 类 模型 ， 除 了 这 四 类 操作 算 子 接 
的 是 优化 后 的 一 个 典型 的 流程 的 结构 ， 图 中 方 框 中 的 内 容 为 流 ”在 叶子 之 后 形成 的 树 权 是 随机 的 ， 操 作 算 子 的 具体 使 用 方法 也 
程 中 的 操作 算 子 ， 该 结构 图 未 注 明 具体 的 操作 内 容 ， 数 据 集 流 ”是 随机 的 。 原 始 数据 单独 经 过 特征 与 处 理 、 分 解 和 特征 选择 这 
经 这 些 操作 算 子 ， 通 过 对 特征 预 处 理 和 主 成 分 分 析 得 到 的 特征 些 操作 后 ， 输 出 的 结果 也 是 特征 集 ， 可 以 接着 经 过 其 他 操作 节 
进行 选择 而 对 原始 特征 进行 添加 、 删 除 和 修改 ， 然 后 选择 分 类 点 。 若 某 个 节点 前 有 多 个 输入 ， 则 经 过 特征 合并 操作 算 子 合并 
模型 及 相应 的 模型 参数 进行 分 类 。 为 单个 特征 集 ， 再 传递 给 下 游 节 点 。 

经 过 模型 选择 节点 的 数据 ， 输 出 结果 为 数据 的 分 类 预测 ， 


mt | 特征 预 处 理 一 若 不 是 最 后 的 建 模 节 点 ， 则 将 该 分 类 预测 作为 一 种 新 的 特征 增 
加 到 输入 的 特征 集 上 ， 并 且 每 经 过 一 个 新 的 建 模 节点 都 会 剔除 
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el 


掉 原来 的 分 类 预测 ， 另 外 在 进化 过 程 中 ， 模 型 和 其 他 操作 的 参 
数 都 是 进化 的 对 象 。 

最 后 的 节点 只 能 是 建 模 节 点 或 多 个 建 模 节 点 的 合并 ， 其 预 
测 结果 作为 评价 该 流程 整体 分 类 性 能 的 指标 。 这 种 基于 树 的 流 
程 允许 各 节点 随意 变换 数量 和 相互 关系 ， 可 以 实现 任意 结构 的 
流程 。 本 文 将 数据 分 为 75% 的 训练 集 和 25% 的 测试 集 ， 全 部 流 


原始 数据 集 PCA 上 


图 1 一 种 基于 树 结 构 的 自动 机 器 学 习 流 程 结 构 


1.1 操作 算 子 程 只 在 训练 集 上 训练 ， 在 测试 集 上 测试 评估 。 
1.1.1 特征 预 处 理 1.3 ”遗传 编程 
TPOT 使 用 的 预 处 理 方法 有 Standard Scaler、Robust Scaler 遗传 编程 的 基本 思想 借鉴 了 自然 界 生 物 进化 和 遗传 理论 的 


上 


和 Polynomial Features。Standard Scaler 工具 根据 样本 的 均值 和 原理， 是 一 种 自动 随机 产生 搜索 程序 的 方法 。 由 于 该 算法 作为 
方差 衡量 特征 的 重要 性 来 对 这 些 特征 的 权重 进行 缩放 ，Robust 一 种 新 的 全 局 优化 搜索 算法 ， 以 其 简单 通用 、 和 鲁 棒 性 强 ， 并 且 
Scaler 是 一 个 鲁 棒 性 很 强 的 缩放 工具 ， 采 用 中 位 数 和 四 分 位 数 。” 对 非 线性 复杂 问题 显示 出 很 强 的 求解 能 力 ， 因 而 被 成 功 地 应 用 
间距 去 缩放 特征 ， 而 Polynomial Features 通过 数值 特征 的 多 项 。 于 许多 不 同 的 领域 ， 并 且 在 近 几 年 中 得 到 了 更 深入 的 研究 外 。 


式 组 合 产生 相互 作用 的 特征 。 为 了 自动 生成 上 节 中 描述 的 基于 树 结 构 的 流程 ， 本 文 使 用 
1.1.2 分 解 了 遗传 编程 的 方法 ， 有 具体 实现 方式 采用 一 种 名 叫 DEAP 的 
TPOT 使 用 Randomized PCA 进行 数据 集 分 解 降 维 ,该 方 。 Python 库 00。 在 本 文 的 情况 下 ，GP 构建 以 流程 操作 算 子 为 节 

法 是 一 种 使 用 随机 奇异 值 分 解 的 主 成 分 分 析 的 变 体 。 点 的 树 型 结构 ,最 大 限度 地 提高 流程 的 最 终 分 类 精度 ,在 这 里 ， 
本 文 使 用 GP 来 演变 进化 作用 在 数据 集 上 的 操作 流程 以 及 这 些 
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操作 节点 的 参数 ， 例 如 
间 选 择 的 
在 本 文中 ,GP 算 


特征 


的 数量 。 


随机 森林 中 的 树 的 
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ll 


或 在 特征 
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反共 


去 遵循 标准 


如 表 1 所 示 。 


定数 量 的 树 
其 分 类 精度 对 这 些 流程 进行 记 
程 个 体 的 适 


代 和 4 


精英 个 体 


应 


度 。 


在 每 个 进化 过 程 运行 3 
型 流程 ， 以 构成 遗传 编程 中 的 初代 人 
F 估 ， 这 里 的 分 类 精度 就 是 这 些 流 


表 1 遗传 编程 参数 设置 


E 进 化 算法 程序 ， 相 
开始 时 ， 系 统 随 机 生成 


。 然 后 


内 容 


[lail 
tm 


100 

100 
90% 

5% 


10% 的 精英 保留 策略 ，3 选 2 锦标 赛 


选择 法 ， 


再 根据 复杂 度 


30 


2 选 1 


I 除 ， 每 类 突变 各 占 1/3 


在 完成 所 有 流程 
E 成 。 为 了 产生 下 
应 度 的 流程 个 体 的 副本 ， 


个 体 的 
一 代 的 
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人 


， 系 统 


5 人 


构建 下 一 代 人 
个 体 ， 
次 比赛 中 ， 淘 汰 了 适应 度 最 低 的 个 体 ， 然 后 从 剩 下 的 两 个 个 体 


中 选 


将 其 
总 量 的 10% (日 
的 其 余部 分 ， 系 统 从 现 有 人 
然后 将 它们 放 进 锦标 赛 中 ， 


复制 
的 90% 的 子 代 人 
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PT 


代 人 


F 一 代 


人 口 创建 完毕 


? 


10% 的 精英 


保留 策略 )。 


关 参 数 设 


设置 


了 回 


根据 


后 ， 系 统 进 行 GP 算法 的 下 一 
首先 创建 了 具有 最 高 适 
于 子 代 的 人 口中 ， 直 到 


这 些 
为 了 


中 随机 选择 三 


系统 将 一 


三 个 


以 决定 哪些 个 体 胜 出 。 在 本 


至 流程 复杂 度 更 低 〈 也 就 是 操作 节点 更 少 ) 的 流程 ， 将 其 
中 。 重 复 这 一 选拔 流程 ， 直 至 填充 完 剩 下 


一 个 点 交叉 算 子 作用 于 


复制 后 的 按 交 叉 率 选择 的 -和 每 次 交叉 将 随机 地 选择 两 


个 个 体 ， 在 流程 结构 中 的 一 个 随机 点 进行 分 
内 容 彼此 交换 。 


突变 ; 
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13 的 机 会 作 | 
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入 突变 : 
体 的 随机 位 置 。 
| 除 突变 : 
当 某 个 复 ; 


换 突变 : 


而 其 余 未 受 


生成 的 流程 序 
将 一 个 新 
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然后 将 它 


们 的 


影响 的 按 突变 率 选 择 的 个 体 将 进行 


随机 选择 个 体 流程 结构 


列 。 


的 随机 生成 的 ; 


随机 剔除 被 删除 个 


FP 的 操作 节点 ， 将 


体 的 某 段 流程 序列 。 
出 后 的 个 体 被 选 为 突变 个 体 时 ， 每 个 变异 算 子 有 
在 突变 个 体 上 。 在 所 有 交叉 和 变异 操 
许 出 现 无 效 的 流程 ， 例 如 ， 将 数 提 
节点 的 流程 是 不 允许 产生 的 。 
在 交叉 和 变异 操作 完成 以 后 ， 上 一 代 的 个 体 被 完全 圳 


作 中 ， 


昌 集 传递 到 输入 为 单个 参 


Dre 


定 的 代数 重复 这 个 评估 -选择 -交叉 -变异 的 过 程 。 
的 方式 ，GP 算法 不 断 地 改变 流程 ， 增 加 新 的 操作 节点 ， 
了 适应 度 并 剔除 了 多 余 的 或 影响 效果 的 操作 节点 。 


坦 


进化 期 


i 程序 列 插入 被 插入 个 


不 多 
数 的 


除 ， 
过 这 
提高 
间 系 


统 发 现 的 单一 性 


涂 同 勿 ， 等 ; 
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能 最 好 的 流程 将 被 跟踪 
在 运行 结束 后 作为 流程 的 最 终 优 化 结果 。 


雷达 辐射 源 信号 


存储 在 单独 的 位 置 ， 


特征 集 


于 笔者 所 参 


射 源 信号 ， 该 数 提 
研究 所 


提供 。 


包括 雷 


(TOA)、 载 频 (RF)、 


脉 内 起 始 位 置 、 
在 该 特征 集中 ， 
数据 外 


脉 


与 项 
昌 集 通过 计算 机 仿真 得 到 ， 
数据 分 为 两 种 类 型 ， 
及 该 片段 的 相关 特征 组 成 的 特征 集 和 脉冲 时 间 


特征 集 包 达 辐 射 


本 文选 


的 原 


因 ， 本 文 所 研究 的 对 象 为 雷达 辐 
西南 地 区 某 电子 
包括 十 部 雷达 脉冲 截取 片段 
序列 。 
源 信 号 的 以 下 参数 与 特征 : 到 达 时 间 
脉 宽 (PW)、 脉 幅 (PA)、 到 达 时 间 差 (DTOA)、 
内 终止 位 置 和 调制 类 型 ( 即 所 属 雷达 编号 )。 


] 载 频 、 脉 宽 和 脉 幅 三 个 特征 作为 原始 


选用 


A 
被 


的 特征 集 ， 


除 此 之 外 ， 本 


Lemple-Ziv(LZ) 和 小 波兰 频 特 得 
内 的 这 一 系列 雷达 信和 号 的 脉 内 特征 
征 主要 表现 在 频率 、 相 位 和 
制 以 及 采 
因而 ， 通 过 度量 信号 波形 的 复杂 度 可 以 将 信 
前 面 提 到 的 信息 维 
在 时 频 平面 的 不 同位 


识别 出 来 ， 
复杂 度 特征 
准 率 ， 其 分 辨 素 可 以 针对 
皮 变 换 对 不 同 的 信号 具有 


小 ; 


Le 


调制 类 型 作为 样本 的 标签 。 

包括 信息 维 数 QF)、 信 息 粹 (IE)、 
FE(Wavelet Ridge Frequency) 在 
。 雷 达 辐 射 源 信号 的 脉 内 特 


局 度 的 变化 与 分 布 上 ， 脉 内 有 无 调 


文 还 提取 了 


用 何 种 调和 


号 的 波形 上 直接 反映 出 来 ， 
号 的 脉 内 调制 方式 


制 方式 ， 将 在 信 


< 
一 ; 


正品。 


数 、 信 息 炉 和 Lemple-Ziv 都 属于 
小 波 变换 具有 不 同 的 分 


可 


时 间 序 列 进行 分 析 
在 一 起 构成 另 
本 文 对 


。 小 》 


水 内 特 和 


进行 
F 皆 在 MATLAB 环 


言 号 的 特性 


自 适应 性 ， 


自动 调节 ， 这 种 特性 使 得 
分 析 非 平稳 信 


非常 适合 


分 析 既 可 ee 又 可 以 察看 信号 的 细节 ， 
因而 被 称 为 “数学 的 显微镜 
达 信 号 调制 类 型 

以 上 


,因此 可 以 通过 小 波 变换 特 


于 征 


对 雷 


识别 D1。 


境 下 使 用 相应 工具 对 脉冲 


提取 得 到 ， 并 与 前 


一 特 生 


面 的 RE、PW 和 PA 组 合 
E 集 ， 供 后 面 的 实验 使 用 。 
两 个 特征 身 


得 到 的 


| 
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除了 经 过 TPOT 方法 使 用 遗传 编程 生成 的 适应 度 最 佳 的 机 
0 本 文 还 引入 了 常规 的 一 
正 集 包括 上 一 节 所 述 


实验 ， 


征集 各 随机 
制 类 型 的 样 
式 调整 以 适 


选取 柱 
本 各 


集中 的 样本 进行 乱 序 排列 ， 每 个 特 


# 本 1000 个 ， 这 1000 个 样本 中 属于 十 部 雷达 


100 个 ， 构 成 最 终 的 两 个 特征 集 


仆 集 ， 经 过 格 


实验 结果 与 


验 仿 特 和 


合 优化 工具 


的 使 用 。 
分 析 


对 一 SVM 方法 进行 对 比 
的 RF、PW 和 PA 三 个 特征 


组 成 的 和 


将 


图 2 和 图 3 是 


四 


表 


其 分 类 准 
以 直观 


本 ， 亚 | 


确 率 均 比 


明显 


E 集 1, 以 及 加 入 
村 征集 分 为 75% 


而 易 见 ， 经 过 遗传 编程 得 到 的 树 型 
岗 更 佳 , 从 平均 结果 看 ,无 论 是 在 特征 集 1 还 是 特 生 


看 到 其 分 类 表现 比 SVM 
了 着 较 大 的 波动 。 除 此 之 外 ， 可 以 看 出 引入 


化 
下 


脉 内 特征 的 特征 集 2, 所 有 的 实验 都 
的 训练 集 和 25% 的 测试 集 。 
SVM 与 TPOT 在 这 两 个 特征 


集 上 的 分 类 效 
由 机 器 学 习 流程 的 分 类 
F 集 2 上 ， 
从 图 中 可 
更 稳定 , 而 SVM 的 分 类 表现 
订 内 特征 的 确 


SVM 高 出 至 少 6 个 百分点 ， 并 且 
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国 
国 


IV 


naX 


i 


ch 


录用 稿 
能 有 效 


也 提高 分 类 准确 率 ， 不 论 是 优化 后 的 机 器 学 习 流 程 还 是 
SVM, 在 加 入 脉 内 特征 后 分 类 准确 率 都 提高 了 至 少 1 个 百分点 。 

Co 极端 隐 机 树 一半 申 千 征 | 

Co 二 新 村 素 由 一夫 大 评估 | 一 | 一" 模型 合并 


树 结构 的 书 
个 副本 ,分别 进入 三 
个 分 类 结果 
具体 的 参数 ， 此 处 暂且 不 表 。 可 以 看 到 这 其 实 
洁 的 流程 ， 虽 然 上 
在 较 大 的 数据 集 上 进化 出 
如 果 模 型 中 包含 人 
间 会 更 可 
优化 来 说 将 是 一 个 


4 展现 的 是 在 特征 集 2 上 经 过 遗传 编程 优化 得 到 的 基于 
1 器 学 习 流程 ， 在 这 个 流程 中 ， 原 始 数据 集 复 制 为 三 


soem] 和 


图 4 TPOT 在 特征 集 2 上 优化 得 到 的 机 器 学 习 流 程 


和 迭代 决策 
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动 


C 
涂 同 诊 ， 等 ; 基于 自动 机 器 学 习 流程 优化 的 雷达 辐射 涛 信号 识别 


结束 语 

本 文 从 机 器 学 习 参 数 优化 的 相关 研究 中 寻找 到 了 另 一 种 自 
进行 机 器 学 习 的 方法 , 即 自动 生成 树 型 结构 的 机 器 学 习 流 程 ， 
通过 遗传 编程 优化 流程 的 结构 和 相关 参数 ， 进 而 得 到 在 搜索 


范 


内 最 优 的 分 类 流程 。 


tt 


台 b 
HE 


情 


重 


通过 在 雷达 辐射 源 信号 特征 集 上 的 实验 ， 可 以 证 明 该 方法 
得 到 很 好 的 并 且 较 稳定 的 分 类 效果 。 但 是 如 果 数 据 集 较 大 ， 
法 进行 遗传 操作 可 能 需要 耗费 较 长 的 时 间 ， 从 本 文 实验 的 
况 看 , 虽然 最 长 的 运算 时 间 达 到 12 个 小 时 , 但 比 起 人 工 进行 
复 实验 而 得 到 效果 并 非 很 好 的 模型 参数 来 说 ， 该 方法 有 着 明 


二 
MH 


个 分 支 进行 特征 处 理 和 分 类 ， 最 后 对 这 三 


进行 合并 得 到 最 终 的 分 类 结果 ， 


优化 的 结果 还 包括 


不 是 一 个 很 简 


这样 


个 流程 去 进行 分 类 的 时 间 很 短 ， 但 是 


二 


取 
或 
今 


上 


较 高 的 效率 和 长 远 的 意义 。 
在 实验 中 也 能 看 到 ， 结 合 较 好 的 特征 能 让 自动 机 学 习 流程 
得 更 好 的 结果 ， 今 后 的 研究 中 可 以 尝试 引入 效果 更 好 的 特征 
特征 提取 算法 ,目前 的 方法 并 未 加 入 ANN 等 人 工 智 能 算法 
后 的 研究 也 可 以 尝试 为 这 些 算法 进行 流程 和 参数 优化 ， 当 然 
文 也 提 到 了 ， 这 样 将 会 耗费 更 为 可 观 的 时 间 ， 因 此 ， 如 何在 


个 最 终 的 流程 可 能 需要 较 长 的 时 间 


= 


经 网 络 (ANN) 的 话 ， 想 必 进化 所 耗 的 时 


DS 


见 ， 这 对 于 往 ANN 之 类 的 智能 学 习 方向 发 展 的 流程 
巨大 的 难题 。 


测试 次 数 


3 SVM 与 TPOT 在 特征 集 2 上 的 分 类 效果 


保 


证 分 类 效果 的 同时 减少 进化 时 间 将 是 这 类 研究 的 重点 。 
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